過去,檔案被嚴格地認為是不經(jīng)常訪問的數(shù)據(jù)的長期存儲庫——想想冷存儲——因此沒有太多考慮智能地管理這些數(shù)據(jù)。希望您的檔案就像您永遠不需要使用的保險單。
隨著云的出現(xiàn)及其利用率的提高,組織已經(jīng)開始發(fā)現(xiàn),除了通過利用云經(jīng)濟實現(xiàn)巨大的成本節(jié)約之外,存檔數(shù)據(jù)本身還具有內(nèi)在價值。為了充分利用這一價值,歸檔數(shù)據(jù)必須有組織、可訪問、可檢索和智能保留。簡而言之,一個“活動”檔案。
非結(jié)構(gòu)化數(shù)據(jù),例如辦公文檔、視頻、音頻文件、圖像、.pdf 以及任何不在數(shù)據(jù)庫中的數(shù)據(jù),現(xiàn)在已成為大多數(shù)組織的命脈。長期智能地存儲這些數(shù)據(jù)不僅對于合規(guī)性和組織歷史至關(guān)重要,而且對于商業(yè)智能、分析、數(shù)據(jù)挖掘和其他目的也越來越重要。
隨著整體數(shù)據(jù)年復一年地以驚人的速度持續(xù)增長,非結(jié)構(gòu)化數(shù)據(jù)以 60% 或更高的速度增長(預計在短短幾年內(nèi)攀升至所有數(shù)據(jù)的 90% 或更多),對使用公共云、私有云或混合云的任意組合以及隨時移動數(shù)據(jù)的輕松能力的主動歸檔的需求一直存在。為了在多云基礎架構(gòu)中最好地管理這些數(shù)據(jù),組織需要遵守以下主動歸檔的基本租戶:
應該組織數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)往往是混亂的——一個典型的組織可以擁有數(shù)百萬個不一定以任何特定方式組織的文件。有些可能存儲在私有云上,有些可能存儲在公共云上。為了理解這一點,能夠根據(jù)內(nèi)部和外部重要的類別對數(shù)據(jù)進行分類和標記是很有幫助的。將“機密”或“合法”視為在審計或 PII 和類似的合規(guī)性事件中檢索數(shù)據(jù)的能力的有用標志。但更重要的是,所有銷售數(shù)據(jù)、所有財務數(shù)據(jù)等都可以分類,以便快速輕松地檢索以備將來使用。
數(shù)據(jù)應該是可訪問的
您需要能夠?qū)?shù)據(jù)存儲在您想要的位置,并輕松獲取。這可能意味著在私有云、公共云甚至跨云中進行本地部署。我們開始看到云供應商之間的競爭越來越激烈,能夠利用不斷變化的云經(jīng)濟是非常有價值的。應該支持本地和真正的多云,能夠隨意跨云目的地動態(tài)遷移數(shù)據(jù),并且不需要管理員記住數(shù)據(jù)的位置。
數(shù)據(jù)應該是可檢索的
與分類和標記相輔相成的是全內(nèi)容搜索。想象一下,能夠使用單詞、短語或其元數(shù)據(jù)快速輕松地搜索 PB 級數(shù)據(jù)和數(shù)百萬(或數(shù)十億)個文件,從而在大海撈針中找到您正在尋找的那根針,而不必知道在哪里或保存文件時(想想谷歌搜索)。這將實際上不可用的數(shù)據(jù)的黑洞打開到可用的存儲庫中。能夠在云存儲庫中定位存檔數(shù)據(jù)并輕松對其進行重新水化,使其成為活動數(shù)據(jù)集的一部分,從而充分利用了該信息的價值。
數(shù)據(jù)應該被智能保留
如果您詢問 IT 管理員的聽眾,他們在數(shù)據(jù)保留方面的公司政策是什么,他們中的絕大多數(shù)人會告訴您,他們會永遠保留所有內(nèi)容。數(shù)據(jù)治理是一個巨大的話題,我們無法進入這篇文章,但可以說最佳實踐并不是永遠保留所有內(nèi)容,而是智能地修剪不再需要的數(shù)據(jù),因為法律、空間、成本,等原因。尤其是生活在多云環(huán)境中的存檔,可以幫助管理員設置策略,以智能修剪不再需要保留的數(shù)據(jù),從而釋放空間并降低存儲成本,避免不必要的和不需要的容量費用。